In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from pandas import DataFrame, Series
In [2]:
fichero_pop_total = 'API_SP.POP.TOTL_DS2_es_csv_v2.csv'
In [ ]:
In [3]:
dfpoptotal = pd.read_csv(fichero_pop_total,sep=',',header=1,skiprows=2) #Lee un fichero csv
In [4]:
dfpoptotal.describe() # resumen estaditico de la data
Out[4]:
In [5]:
dfpoptotal['2015'].describe() # describe la columna seleccionada
Out[5]:
In [6]:
dfpoptotal['2015'].value_counts(dropna=True) # value_counts(), metodo que retorna la frecuencia para cada entrada única
Out[6]:
Visualización de datos
In [7]:
# Histograma
dfpoptotal['2015'].plot(kind='hist', rot=70, logx=True, logy=True)
# show
plt.show()